聚数成湖
树上一双鸟,林间一池泉。
柔和的光线穿过云层照进落地窗,伴随脚步赫然出现在眼前的,是掩映在茂盛绿植中的办公工位。直到一台D-Box光磁一体机将思绪从自然环境拉回科技社会,人们才意识到,这个被打造成绿色生态体的建筑,正是天津市津南区中国华录未来科技园的双创中心。
易华录构建数据生态体系的美好愿景在这里被直观地呈现出来。但作为城市级“数据湖”的探索者,易华录在实现“聚数成湖,联湖成海”的最终设想之前,也势必面临更多、更难的挑战。
01
变湖为沼的担忧
存不起、留不住、用难求。
面对大数据指数级增长,数据存储、流通难题已成限制智慧城市、数字政府的建设的瓶颈。与此同时,可集中存储、按需处理海量异构多源数据,无需提前定义数据模型的数据湖模式,正在逐渐被业界接受,国内外陆续有相关项目发布。
微软、AWS先后推出基于公有云的数据湖解决方案,今年上半年Databricks官方博客宣布开源DeltaLake项目,8月AWS又推出AWS Lake Formation数据湖全面管理服务。相关资料显示,易华录2016年在国内率先提出了“城市数据湖”的理念,目前已有多个城市级数据湖项目落地。易华录城市数据湖建设风生水起的同时,品高云上线了私有云数据湖,明析数据欲搭建工业数据湖平台……“数据湖”概念一时风头无两。
目前看来,易华录提出的“城市级数据湖”是一个特别的存在。
城市数据湖通过集中储存政务、工业、医疗、农业、教育、旅游、税务、交通、公安等数据,对其进行有效整合处理与分析并加以利用,改变以往的数据孤岛形态。2019年易华录半年报显示,上半年该公司营收13.74亿元,同比增长8.68%;归属于上市公司股东的净利润1.8亿元,较上年同期增长65.71%。上半年,数据湖业务同比增幅83.71%,营业利润4.22亿元,接近公司营业利润的七成。目前,易华录已有15个数据湖项目相继落地,数据湖成为其母公司华录集团央企转型的重要抓手之一。
然而,面对林林总总的“数据湖”项目,业界也不乏忧虑,最根本的担忧来自于“数据湖”变为“数据沼泽”的潜在风险。
业内人士介绍,数据湖模式对服务器及数据处理能力要求颇高。但除技术之外,影响数据湖项目落地运转的根本问题在于其整个生态系统的架构是否合理。以往公司层面的部分数据湖案例显示,汇集海量数据的数据湖必须通过合理、简化、高效的体系设计,才能避免数据不流通变成“死水”甚至“沼泽”,非常考验架构设计和管理者的智慧。
02
湖,是基础设施
难,但并非无路可走。
联合上下游企业,借力地方政府,易华录希望业内共同发力,构筑城市数据生态,促进数据流转。
2018年11月,易华录联手浪潮、金山云、360企业安全、启明星辰、深信服、九次方、格灵深瞳等100多家互联网、大数据、人工智能领域知名厂商、研究机构、资本方和产业运营商,共同发起数据湖生态联盟。近期,易华录又与华为、绿地、旷视、比特大陆达成合作,截至发稿,联盟成员单位已经达到了300多家,涵盖工业、农业、金融、医疗、交通、物流、环保、水利、安防、旅游等各行各业。
对于各大云商的智慧城市、数字政府项目,易华录更是表示“喜闻乐见。”
天津·津南数据湖作为全国首个城市级“数据湖”项目,成为易华录在各地推广数据湖业务的模板。津南数据湖相关负责人向泰伯网介绍,目前津南区多个相关部门数据正在进“湖”,未来仅津南区政府数据预计将达到200-300PB,并为市级数据湖预留2000PB以上的光磁融合、冷热结合的存储空间。基于现有政府数据,易华录将联合数据湖联盟生态单位进行数据加工,在政务、经济、社会治理、生态文明、文化等方面开发应用,为相关部门提供决策参考,助力津南区产业升级转型。基于津南数据湖,今年津易公司将启动智能交通、智慧医疗、幼儿园三级监管、区一级视频会议、军地一体化平台等数个应用项目建设。
此外,汇集全市相关数据的天津“数据银行”项目,也在天津网信办支持和监管下开始试点建设运营。据悉,以津南数据湖为基础,“数字银行”将面向政府企事业单位及个人用户开展受托数据存储、治理、分析、应用、资产确权、价值评估等服务,打通数据变现“最后一公里”,从而形成数据湖生态中建湖、引水、水资源利用的生态闭环。
03
复制与蜕变
青岛、重庆、徐州、开封、泰州……天津的数据湖+产业生态的项目经验正在各地复制,更基于当地特色,完成着各自的蜕变。
易华录方面表示,津南数据湖是易华录的经典案例,但并非全国的数据湖项目全盘按照这一模式复制。数据湖这一新生模式目前仍在推广初期,各地会优先服务于当地政务部门需求,后期则会根据各地优势产业,发展出不同的优势产业服务方向,最终“联湖成海、繁荣共生”,打造全国联动的数据产业服务底盘。
潘德炉院士曾将大数据比作是“智慧海洋建设的灵魂”,认为数据将是人类认知海洋的基础。然而,虽然基于海洋的数据量不断增加,海洋大数据的体系建设却刚刚起步。据相关负责人介绍,海洋数据体量比较大,格式也非常复杂,对多源异构的海洋数据进行预处理时必须结合海洋的专业知识和模型。最让他们“头疼”的是,目前国内针对海洋大数据的管理模式仍不够成熟,从数据采集开始,海洋大数据就缺乏统一的行业标准,导致海洋大数据难以合理分类“入湖”。
由于海洋数据产业的特殊性,青岛数据湖率先为海洋国家实验室、中国海洋大学等涉海科研院所提供服务,并与海洋国家实验室联合对海洋大数据进行梳理分类,希望从源头理清海洋大数据的脉络,为物理海洋建设提供参考。未来计划基于物理海洋、海洋生物、海洋地质、工程材料等细分分类,分别设立文献库、数据、知识库、规格、算法、智能库等细分库。未来,青岛数据湖将不仅服务于青岛当地,还计划辐射全国海洋产业,为涉海科研院所、企业、创新创业团队等对象提供大数据服务。
重庆·南岸数据湖则在落地伊始基于易华录的传统行业优势,与公安部门展开了密切合作。
据了解,目前该公司已与重庆市南岸区公安分局建立了联合实验室,希望通过对交通数据的监测和分析,为智慧交通建设提供解决方案。王道静指出,智慧交通的建设将会涉及到对重点人群、重点车辆的管控,解决以往由于数据存储的局限性导致的公安监管信息不足等问题。未来,来自公安交管、交通运输等行业的海量数据将汇聚在这一占地42亩、存储能力达1000PB的“城市数据湖”项目中。基于海量政务数据,未来南岸数据湖还将根据实际情况,拓展更多行业的应用方向。
04
且行且期待
——【加群提示】——
泰伯高校教师群
泰伯航空航天爱好者群
泰伯青年大学生交流群
泰伯全球读者交流群
泰伯新闻通讯群
泰伯微信开白群
入群请加泰伯小姐姐微信:17864105751
杭州云栖大会上,我想到了南半球的非洲兄弟
《精读》